JSAI2026 VLM図表理解の評価データセットのスケーラブルな拡張に向けて
テーマ
既存手法をPlantUMLを理解(評価)できるように拡張した
これまではPowerPointや手描きの図に対応していた
daiiz.icon
UMLはテキストで記述できるが、これをテキストとしてLLMで解釈したときと、レンダリング済みの図として提案手法のVMLで解釈したときとでは、どちらがよいか?
→ まだ比較していない
PowerPointデータも突き詰めればXMLだが、たぶん図としてVMLで評価した方が適切だと思う
UMLはその気になればどちらでも解釈可能そうなので気になる
実験してみようかな daiiz.icon
#聴講メモ